未經審查模型

一般來說模型在進行訓練的時候，工作人員會提供相當大量的資料檔案來做訓練，有些資料內容比較具有爭議性像是：性、毒品、色情、戰爭、人種這些議題。因此在發布的時候就會將這些資料想辦法排除在外。

舉個例來說，台灣 TAIDE 推出了一個 Llama3-TAIDE 模型。在訓練方式的欄位就有特別告知說，在進行資料前處理的時候，會先「去除不當文字，如賭博、色情等」以及「去除個資，如 email、電話」這些步驟。

所以，Llama3-TAIDE 這個模型就是「經過審查」；反之，沒有做這些處理的模型就稱為 uncensored。

Reference